Aula 6 — Partial Least Squares SEM (PLS-SEM)
Estatístico — CONRE 1ª Região Nº 11477
TEORIA QUALITATIVA!
O que a teoria indica que forma gestão de documentos? O que a teoria indica que forma gestão de conhecimento?
Ex: Se o estudo fosse sobre “Governança”, a teoria indica que este é um construto complexo, em que a literatura indica como a governança sendo formada por “Disclousure”, “Compliance”, “Fairness” e “Accountability”.
OBSERVAÇÕES: Sobre o projeto específico: Se o cliente tivesse boa certeza da teoria qualitativa, o CB-SEM seria a melhor alternativa, como estávamos fazendo.
PLS-SEM é especialmente útil quando não temos uma teoria qualitativa robusta, mas temos DADOS (poucos, pode ser), e queremos testar algumas hipóteses simples.
Neste sentido, o cliente está explorando o PIOR dos dois mundos: CB confirmaria a teoria com dados sintéticos. PLS criaria alguma teoria com poucos dados.
PLS com dados sintéticos irá explorar caminhos não confirmatórios sobre dados que não existem.
“Confirmatória”
Orientado à reprodução da matriz de covariâncias
NÃO usa componentes principais: Fatores comuns. (Variância comum entre manifestas e latentes).
“Exploratória”
Orientado à maximização da variância explicada (R²)
Abordagem de variável composta:
Combinações lineares iterativas dos indicadores para maximizar a variância explicada (não é ACP, mas compartilha a lógica de variáveis compostas).
Variável composta \(\neq\) traço latente.
Tamanho amostral: “pequeno”, em geral.
Distribuição dos dados não precisa ser normal. Porém, utilizaremos bootstrap para validação e IC dos parâmetros. Distribuições com divergências graves de assimetria e curtose em relação à Normal, podem influenciar negativamente o procedimento.
Linearidade.
(Nominal < Ordinal < Discreta < Contínua)
OU A impacta B, OU B impacta A.
OBS: Todo construto deve ter papel teórico no modelo.
(Variáveis exógenas puras não recebem setas, mas podem existir construtos apenas explicativos)
Valores influentes (OBS:Não será um problema para nós);
Endogeneidade: Correlação entre variáveis exógenas com termo de erro: Se as variáveis exógenas estão associadas à termo de erro, indica omissão de variável, que não está no modelo.
Heterogeneidade: Pressupõe grupos HOMOGÊNEOS. Caso existam clusters (características sociodemográficas), devem ser indicados.
Efeitos não lineares.
Fonte: “Structoral model robustness checks in PLS-SEM”. Sarstedt, M. Ringle, C. M., Chea, J., Ting, H. Moisescu, O., & Radomir, L. (2019). Tourism Economics, 26(4), 531-554.
Variáveis endógenas: “Recebem setas” de outras latentes/compostas;
Variáveis exógenas: NÃO “recebem setas” de outras latentes/compostas;
Construtos formativos NÃO aceitam bem correlações fortes entre as manifestas que formam o construto -> Regressão MULTIPLA.
Reflexivo: EXIGE alta correlação para as manifestas -> Regressão MULTIVARIADA.
Identificar causalidade: Quem causa quem?
Como identificar: Teoria Qualitativa: A análise quantitativa NÃO é capaz de identificar.
Regra de bolso: Se as manifestas VÃO ser feitas ainda, é REFLEXIVO. Se as manifestas JÁ ocorreram (passado), é FORMATIVO.
Note: Estas manifestas REFLETEM a satisfação. Coisas que VÃO ser feitas ainda.
Note: Estas manifestas FORMARAM a satisfação. Estas coisas ACONTECERAM.
FONTE: Wilcox, J. B., Howell, R. D., & Breivik, E. (2008). “Questions about formative measurement”. Journal of Business Research, 61(12), 1219–1228. https://doi.org/10.1016/j.jbusres.2008.01.010
Existem três implementações principais dos esquemas de ponderação:
Modelo de centroide
Modelo fatorial
Modelo de caminho
A literatura frequentemente recomenda o modelo de caminho quando não existem construtos formativos. Quando existem estes, o modelo fatorial é frequentemente recomendado.
plspm no RA função principal do pacote é a plspm(), que funcionará de maneira análoga à um lm() para ajuste, com os seguintes argumentos principais:
Dados;
Diagrama de caminho: Matriz booleana triangular inferior;
Blocos: Relação de variáveis manifestas por variável latente;
Indicar se a relação é reflexiva ou formativa;
Esquema de ponderação (centroide, fatorial, caminho);
Padronização de variáveis MANIFESTAS;
Tolerância para convergência;
Máximo de iterações;
Bootstrap.
OBS: APENAS para REFLEXIVOS.
Confiabilidade INTERNA (unidimensionalidade):
Alfa de Cronbach (C.alpha) -> 0.5/0.6/0.7 < alfa < 0.9/0.95;
Medida de confiabilidade composta [MCC] (DG.rho) -> 0.7 < alfa < 0.9;
Autovalor (eig.1st,eig.2nd)
OBS: Medem precisão, mas não medem acurácia.
Regras de bolso:
Alfa de Cronbach como limite inferior, MCC como limite superior.
Para as duas primeiras, especialmente alfa: Valores > 0.95 indica redundância semântica.
1º Autovalor >1 E “significativamente superior” ao 2º autovalor.
Fontes:
“A primer on Partial Least Squares Structural Equation Modeling (PLS-SEM)”. Hair et al.
“PLS Path Modeling with R”. Gaston Sanchez.
Cargas (loadings); -> Correlação entre a variável manifesta e a variável latente.
Indicador associado ao ITEM
Regra de bolso: Carga > 0,708 (quadrado > 0,5) -> Carga em valores ideais.
Comunalidade (do item); -> Quanto da variação do item é explicada pelo construto.
Indicador associado ao ITEM
Regra de bolso: Comunalidade > 0,5 (afinal, é o quadrado do loading).
Média da variância extraída (AVE) -> Soma dos quadrados das cargas / n
Indicador associado ao CONSTRUTO
Regra de bolso: AVE >= 0.5 -> Média da comunalidade do item.
Verifica se os itens estão apontando para as latentes corretas.
Critério: Carga entre variável manifesta e variável latente a qual pertence seja superior do que em outras variáveis latentes (medida discriminante)
Critério: Calcula a raiz quadrada da AVE, e comparar com a correlação do construto em relação aos outros (Desejável: Raiz quadrada da AVE > correlação)
Critério: Ponto de corte: Observar IC, se não passar pelo 1, indica Validade discriminante. Valores pontuais < 0.85 / 0.90 são frequentemente usados como referência.
Análise de redundância. Critério: Reflexivo > .7, então “deve servir para formativo”. (um pouco duvidoso este critério)
Fator de inflação de variância (VIF). Critério: < 5
Pesos (weights) -> Avaliar significância e relevância.
. < 5 -> Sem problemas de colinearidade.
Verificar se há colinearidade dos construtos EXÓGENOS em relação aos ENDÓGENOS.
OBS: Aparentemente, NÃO será uma questão neste projeto, visto que não existem múltiplas exógenas apontando para endógena(s): há apenas 1 endógena e 1 exógena!
Setas entre os modelos estruturais
Verificar significância estatística E relevância (tamanho do peso)
OBS: Caso concreto: GD -> GC, apenas.
Efeito total: Efeito direto + efeito indireto.
OBS: Não teremos, aparentemente, avaliação de efeitos indiretos neste projeto, visto que não há latentes compostas (latente1 -> latente2 -> latente3 => avaliar efeito de l1 em l3).
R²: Interpretação análoga à regressão múltipla:
Quanto da variação da variável latente exógena explica a variação da variável latente endógena.
Regra de bolso (relativa): <.15: Baixo; .15 < R² < .6: Médio. >.6: Alto.
adj. R²: Interpretação análoga à regressão múltipla
Idem ao R², mas mais robusto para comparação de modelos.
Contribuição do construto exógeno para um construto endógeno. contribuição de variável dependente em contexto de regressão. (não vai fazer muito sentido neste projeto, pela mesma questão do efeito indireto).
Q²: Se > 0, indica que o construto exógeno têm relevância preditiva para construto endógeno. (Apenas faz sentido para REFLEXIVAS).
q²: Se existe relevância preditiva, então o quanto uma variável contribuiu para a outra.
O quanto que a variação das variáveis manifestas da variável exógena explica a variação das variáveis manifestas da variável endógena.
Problemático quando existem construtos formativos. Se existem apenas construtos reflexivos, não existem tantos problemas. 0 a 1 -> Explicação da qualidade do modelo de mensuração e estrutural, conjuntamente. Medida geral.
Regra de bolso (Tenenhaus et al., 2005): Baixo: GoF <= 0.1 Médio: GoF =~ 0.25 Bom: GoF => 0.36
Bootstrapping;
Convergência.
O modelo faz sentido teoricamente?
As direções das setas são justificáveis?
Os construtos são reflexivos ou formativos?
O objetivo é explicação ou predição?
Vamos ao R
Não prova causalidade
Não substitui teoria
Não valida modelos mal especificados
Não corrige dados ruins
Canal Youtube - Prof. Adonai Lacruz. Série “PLS-PM no R”. Videos 1 a 5.
PLS-SEM or CB-SEM: update guidelines on which method to use”. Hair Jr, Matthews, Matthews, & Sarstedt, M. (2017)
“Structoral model robustness checks in PLS-SEM”. Sarstedt, M. Ringle, C. M., Chea, J., Ting, H. Moisescu, O., & Radomir, L. (2019). Tourism Economics, 26(4), 531-554.
Wilcox, J. B., Howell, R. D., & Breivik, E. (2008). “Questions about formative measurement”. Journal of Business Research, 61(12), 1219–1228. https://doi.org/10.1016/j.jbusres.2008.01.010
“A primer on Partial Least Squares Structural Equation Modeling (PLS-SEM)”. Hair et al.
“PLS Path Modeling with R”. Gaston Sanchez.
Dúvidas?
Feedbacks?